import com.google.common.base.Charsets
import com.google.common.hash.{BloomFilter, Funnels}

object BloomFilterDemo {
  def main(args: Array[String]): Unit = {

    // 参考数据集
//    val arr: Array[String] = "aa,bb,cc,dd,ee,abc,ddb,cce,xxy,xxa,abx,axy,aby,wr".split(",")
//
//
//    val bloomFilter: BloomFilter[String] = BloomFilter.create(Funnels.stringFunnel(Charsets.UTF_8), 10000000, 0.00001)
//    // 映射数据进布隆过滤器
//    for(s <- arr){
//      bloomFilter.put(s)
//    }
//
//    // 使用布隆过滤器来判断一个字符串是否存在于参考数据集中
//    println(bloomFilter.mightContain("bbb"))
//    println(bloomFilter.mightContain("bcc"))
//    println(bloomFilter.mightContain("cce"))
//    println(bloomFilter.mightContain("xxx"))


  }

}
